#эффективный инференс31.05.2025
WINA от Microsoft: Революция в эффективном запуске больших языковых моделей без дообучения
Microsoft и партнёры представили WINA — новый метод безобучающейся разреженной активации, который значительно улучшает эффективность и точность инференса больших языковых моделей, используя активации нейронов и нормы весов.